# 特征工程
"""
1. 数据特征分为连续特征和分类特征两种类型。
2. 连续特征是由浮点数组成，如像素明暗程度、花的尺寸测量等，它们以连续的方式变化。
3. 分类特征（也叫离散特征）通常不是数值，如产品的品牌、颜色、销售部门等，不同分类之间没有顺序且没有中间状态。
4. 数据表示方式对机器学习模型性能影响巨大，数据缩放很重要，如缩放到单位方差会影响结果，额外的特征扩充（如添加交互项、多项式等）也有助于提升性能。
5. 找到最佳数据表示是特征工程的任务，它对监督模型性能的影响比所选择的精确参数更大。
"""